期刊
  出版年
  关键词
结果中检索 Open Search
Please wait a minute...
选择: 显示/隐藏图片
1. 融合多语义特征的命名实体识别方法
左亚尧, 陈皓宇, 陈致然, 洪嘉伟, 陈坤
《计算机应用》唯一官方网站    2022, 42 (7): 2001-2008.   DOI: 10.11772/j.issn.1001-9081.2021050861
摘要513)   HTML22)    PDF (2326KB)(242)    收藏

针对语言普遍存在的字符间非线性关系,为捕获更丰富的语义特征,提出了一种基于图卷积神经网络(GCN)和自注意力机制的命名实体识别(NER)方法。首先,借助深度学习方法有效提取字符特征的能力,采用GCN学习字符间的全局语义特征,并且采用双向长短时记忆网络(BiLSTM)提取字符的上下文依赖特征;其次,融合以上特征并引入自注意力机制计算其内部重要度;最后,使用条件随机场(CRF)从融合特征中解码出最优的编码序列,并以此作为实体识别的结果。实验结果表明,与单一采用BiLSTM和CRF的方法相比,所提方法在微软亚洲研究院(MSRA)数据集和BioNLP/NLPBA 2004数据集上的精确率分别至少提高了2.39%和15.2%。可见该方法在中文和英文数据集上都具备良好的序列标注能力,且泛化能力较强。

图表 | 参考文献 | 相关文章 | 多维度评价